重新定义跨模态生成的流匹配范式,VAFlow让视频「自己发声」 本文第一作者是中国人民大学高瓴人工智能学院 2021 级博士生王希华(导师宋睿华),他的主要研究兴趣方向是多模态生成。本文通讯作者是宋睿华长聘副教授,她的 AIMind 团队主要研究方向是多模态感知、交互与生成。 视频 模态 范式 高斯噪声 vaflow 2025-10-31 15:23 5